Estrategias de generación y reducción de variantes de pronunciación en sistemas de reconocimiento automático de habla: consideraciones arquitecturales

نویسندگان

  • Javier Macías Guarasa
  • Javier Ferreiros
  • Ricardo de Córdoba
  • Juan Manuel Montero-Martínez
  • José David Romeral
  • José Manuel Pardo
چکیده

In the context of large vocabulary speech recognition systems, it is crucial to accurately model the allophonic variations that will be found in a real world task. In this paper we describe a study on the use of data driven pronunciation variations, considering the generation and reduction strategies, as well as their impact in the system performance. The described techniques are supported by the corresponding experimental evaluation on two radically different systems in what respect to their discrimination power (based on integrated and non-integrated architectures, designed to work as hypothesis and verification modules, respectively), so that it’s possible to discuss on their relative performance as a function of the increase in dictionary size. The most relevant results show that in the case of the non integrated architecture, we can significantly improve the inclusion rate, even for huge increases in dictionary size (up to 250%). On the contrary, the increase in the number of pronunciation variants has a clearly negative effect when applied to the integrated system.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Sistema de reconocimiento multilenguaje del habla

Resumen. Este trabajo se comienza con la presentación de una serie de art́ıculos relacionados con el Reconocimiento Automático del Habla. Se realiza un análisis de cada uno de ellos donde se obtienen datos relevantes y los que serán de gran ayuda para desarrollar la propuesta multilenguaje de un sistema de reconocimiento del habla aqúı descrito. Existen varias técnicas que son aplicadas para log...

متن کامل

Una Propuesta para el Etiquetado Automático de Roles Semánticos

Resumen: La identificación de los roles semánticos es una parte crucial en tareas que involucran tratamiento automático del lenguaje natural como la extracción y recuperación de información, sistemas de búsquedas de respuestas, generación de resúmenes, traducción automática, etc. Para el caso del español, la investigación en roles semánticos es escasa. El objetivo del actual trabajo es analizar...

متن کامل

Factores en el reconocimiento facial de emociones y la integración de optimización evolutiva

Resumen. En este art́ıculo se presenta la integración de los Algoritmos Genéticos (Genetic Algorithms, GA) con Análisis de Componente Principal (Principal Component Analysis, PCA) y Redes Neuronales Artificiales (Artificial Neural Networks, ANNs) como un método para mejorar el reconocimiento de emociones en expresiones faciales. Para la evaluación del método dos bases de datos fueron considerada...

متن کامل

Diego Milone -04\2010 Breve Curriculum Vitae Datos Personales Artículos En Revistas Con Referato

07/2003 Recibe el t́ıtulo de Doctor Ingeniero en Electrónica por la Universidad de Granada (España) Programa de doctorado “Nuevas perspectivas en microelectrónica y tecnoloǵıa de computadores” (Promedio 10), Tema de Tesis: “Información acentual para el reconocimiento automático del habla”. Calificación 10/10 (Sobresaliente Cum Laude por Unanimidad). Departamento de Electrónica y Tecnoloǵıa de Co...

متن کامل

Extracción de contextos definitorios en textos de especialidad a partir del reconocimiento de patrones lingüísticos

La extracción automática de definiciones a partir de textos de especialidad es una tarea cada vez más demandante para diferentes aplicaciones del Procesamiento de Lenguaje Natural, tales como lexicografía computacional, extracción de información, semántica computacional, sistemas preguntarespuesta, minería de textos, Web semántica y aprendizaje automático. Este artículo presenta un panorama de ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 31  شماره 

صفحات  -

تاریخ انتشار 2003